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© Proc6d6 de television pour programmes muitiiingues. 

© Precede de television pour programmes muitiiingues. 

Selon ('invention on modifie 1'image d'origine (EVo) au- 
tour des centres phonateurs a I'aide de signes phonovisuels 
commandos par la vote sonore de traduction (ES't). Le hiatus 
entre le son (ES't) et rimage (EVt) est ainsi reduit 

Application en television. 
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PROCEDE DE TELEVISION POUR PROGRAMMES MULTILINGUES 



La prsssnts invention a pour objet un precede de 
television pour programmes muttilingues. 

De tels programmes soulevent des difficultes nom- ' 
breuses qui tiennent essenbeilement a ce qu'il taut 
completer le message sonore d'origine, prononcs par les 
locuteurs intervenant dans la scene televisee, par un mes- 
sage prononce dans une langue diffsrsnts. La technique 
actusfle fait appel a deux types de solutions. La premiere 
consists a sous-titrer ('image televisee. Le principe en est 
rappele sur la figure 1. A remission, on dispose d'un 
"ecran visual" d'origine EVo constitus par I'image a 
televiser et d'un "ecran sonore" d'origine ESo constitue par 
les votx des locuteurs, auxqueiles peuvent s'ajouter divers 
bruits d'ambiance et de brurtags. A la reception, I'ecran 
visuel d'origine EVo est reproduit avec, en incrustation, un 
ecran graphique de sous-titrage EG. L'ecran sonore d'origi* 
ne est egaiement reproduit 

Les liaisons en trait continu 10 et 11 symbolisent la 
transmission sans alteration des ecrans visuel et sonore, et 
la liaison en tirets 12 la traduction de l'ecran sonore d'origi- 
ne ESo en un ecran graphique de sous-titrage EG. 

Une deuxieme solution connue consists a creer une ou 
des votes so nones de doublage. Le principe en est rappele 
sur la figure 2. L'ecran visuel d'origine EVo est encore 
reproduit sans modification. Mais un ecran sonore traduit 
ESt est substitue a i'ecran sonore d'origine. Cat ecran 
sonore traduit est produit sous une double contrainte : d'une 
part, le message de doublage doit etre evidemment la 
traduction assez fideie du message d'origine ; d'autre part, 
le message sonore doit tenir compte, notamment dans sa 
duree. de I'image transmise, puisque cette duree doit etre 
sensiblement egale au temps pendant tequel le mouvement 
des levres du locuteur d'origine est perceptible. Cette dou- 
ble contrainte est schematisee par les fleches en tirets 13 
et 14. 

Bien que ces solutions donnent satisfaction a certains 
egards, sites posent encore de nombreux problemes, qui 
tiennent au coOt sieve de mise en oeuvre, aux drfficultes 
propres aux emissions en direct (le doublage est diffici- 
lement envtsageabie) et surtout a ieur faible acceptabilite 
psychosociologique. Cost avant tout le second problems 
que se propose de resoudre l'invention et Ton peut, pour 
cette raison, le preciser davantage. 

Dans le cas du sous-titrage, on remplace une per- 
ception auditive immediate par une perception visuelle qui 
suppose la lecture d'un texts, et ceia ampute gravement la 
capacite de communication du medium. Dans le cas du 
doublage, les contraintes phoneticovisuelles soulignees plus 
haut sont telles que le contenu du message de doublage 
peut devenir semantiquement inacceptabie. C'est le cas 
notamment des textes litteraires, ou des di scours politiques 
ou informatifs, dont la traduction n'est parfois qu'approxima- 
tive. 

En outre, et malgre le soin ap ports a la synchronisation 
entre les mouvements de I'organe phonateur du locuteur et 
le message sonore percu par le tetespsctateur, ii exists 
souvent un hiatus phorieticovisuel difficile a supporter. 

L'invention a pour but de resoudre ce probleme dif- 
ficile. Pour cela, ells preconise de s'y prendre de la maniere 
suivante. Au lieu de reproduire, sur le recepteur de 
television, I'ecran visuel d'origine, on produit un ecran visuel 
qu'on appellera "transcrit" et qui resulte d'une modification 
de I'image d'origine, cette modification etant determi nee 



par l'ecran sonore traduit Quant a ce dernier, il est obtenu 
selon invention, non pas sous la forte contrainte 
phoneticc-visueile soutignee pius haut, mais sous la con- 
trainte principle de la fidelite de traduction. 

5 Selon l'invention la modification de I'image d'origine 

s'effectue dans les zones ou les organes phonateurs des 
locuteurs sont en mouvement perceptible. Ces domaines 
particuliers de I'image sont I'objet d'un traftement destine a 
faire apparaTtre un signe qui sera dit "phono-visuel" et qui 

10 est anime d'un mouvement synchronise non pius sur les 
voix d'origine des locuteurs comma dans Part anterieur, 
mais sur les voix des locuteurs-traducteurs correspondants. 

Le hiatus phonetico-visuel, si genant dans Tart 
anterieur, s'en trouve done supprime, puisque le mouve- 

75 ment percu par le telespectateur dans la zone des organes 
phonateurs des locuteurs, est cette fois, directement lie au 
message sonore reproduit 

Naturellement, ce ou ces signes phono-visuels qui 
viennent modifier ('image d'origine, perturbent legerement la 

20 qualite de celle-ci. lis expriment somme touts le caractere 
linguistiquement artificie! de I'ecran sonore transcrit Mais on 
sait par experience, que le "vu" est moins signifiant que 
"I'entendu", de sorts que le telespectateur s'accommode 
fort bien du caractere artificial de certaines zones de 

25 I'image, et ceci d'autant mieux que cet artifice conduit a 
une meilleurs qualite semantique du message entendu. 

Si I'on reprend le type de schemes des figures 1 et 2, 
ie precede de l'invention peut etre illustre comme sur la 
figure 3. On y voit un ecran sonore traduit ESt' realise sous 

30 faible contrainte (avec la seule contrainte semantique 13, 
mais sans contrainte visuelle 14) ; cet ecran sonore est 
combine avec l'ecran visuel d'origine EVo et l'ecran sonore 
d'origine, pour former un ecran visuel transcrit EVt 
('operation de combinaison etant symbolises par le cerde 

35 15. 

De facon plus concrete, dans le procede de {'invention, 
on s'y prend comme suit Tout d'abord et de maniere tres 
generate, on effectue un certain nombre d'o Derations que 
I'on trouve deja dans des precedes connus travaillam par 

40 doublage des voies de son. II est a peine besoin de 
rappeler a ce sujet que, dans tout un precede ds television 
concemant des programmes multilingues, on commence par 
former un signal video correspondent a la scene a televiser 
(qu'il s'agisse d'une prise de vue video directe ou d'une 

45 image ds telefilm), on forme un signal audio correspondent 
aux paroles prononcees par les locuteurs intervenant dans 
la scene en question, on forme egaiement des signaux 
audio de doublage provenant des locuteurs-traducteurs, on 
emet tous ces signaux sous forme d'un signal de television 

50 composite (video et audio), soit par diffusion par ondes 
hertziennes, soit par cable, etc., on recoit ce signal com- 
posite sur un recepteur de television, lequel est apte a 
reconstituer une image de la scene en question a partir du 
signal video et a -restituer les paroles prononcees soit par 

55 les locuteurs d'origine, soit par les locuteurs traducteurs, a 
partir des signaux audio. Naturellement divers signaux de 
synchronisation (de ligne, de trame, etc) sont egaiement mis 
en oeuvre. ainsi que diverses voies sonores d'ambiance et 
de bruitage. Mais, comme ces signaux ne jouent pas de 

60 role essentiel dans la presente invention, ils seront passes 
sous silence dans la suite de la description. 

Le procede de l'invention reprend ces operations con- 
nues et il est caracterise par le fait que : 

55 a) a la production : 
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- on effectue une analyse spatiate de I'image pour detecter 
ta presence et definir ('emplacement de domaines phona- 
teurs et Ton traduit cette analyse en un premier type de 
donnees, 

- on effectue une analyse temporeile des intervalles phona- 
teurs des locuteurs d'origine pour determiner notamment le 
debut et la fin de ces intervaJles et I'on traduit cette analyse 
en un deuxieme type de donnees. 

• on etfectue une analyse temporeile des intervaJles phona- 
teurs des tocuteurs-traducteurs pour determiner notamment 
le debut et la fin de ces intervaJles ainsi que revolution de 
leur actrvite de phonatran et I'on traduit cette analyse en un 
troisieme type de donnees, 

• on rassemble ces trots types de donnees phonovisuelles 
pour constituer un code phonovisuel, 



b) a remission, a la transmission ou a renregistrement : 



- on associe par muftiptexage ce code phonovisuel au 
signal de television composite precrte, en vue de le trans- 
mettre ou I'emettre ou I'enregistrer, 



c) a la reception : 



• on separe le code phonovisuel ainsi multiplexe du signal 
composite, 

- on en extrait tes donnees d'image traduisant I'empla- 
cement des domaines phonateurs, les donnees de son 
relatives a la voie sonore d'origine et les donnees de son 
relatives aux voies sonores de traduction, 

- on setectionne I'une des voies sonores d'origine ou de 
traduction, 

- en cas de selection d'une des votes sonores de tra- 
duction, on forme a partir des donnees d'image et des 
donnees de son correspondant tant a la vote sonore d'origi- 
ne qu'a la voie sonore solution nee, au moins un signe 
phonovisuel prenant place dans I'image aux emplacements 
des domaines phonateurs, ce signe etant genere au moyen 
notamment de donnees recues, 

• on affiche sur I'ecran du recepteur non pas I'image 
d'origine mais une image modifiee par ce signe phonovisuel 
aux fins, soft de diminuer le hiatus phonovisuel entre I* image 
et le son percus par le telespectateur, sort de permettre 
l'affectation non ambtgud d'une vote entendue, a un !o- 
cuteur vu. 



Le ou les signes phonovisuels utilises dans rinvention 
peuvent etre de formes tres diverses. Selon une variante 
avantageuse, on utilise deux signes phonovisuels : 

• un premier signe en forme de voile defini dans sa position 
et sa grandeur par les donnees du premier type et du 
second type, 



• un second signe combine au precedent et defini par les 
donnees du troisieme type et notamment une donnee liee a 
I'activite phontque du locuteur-traducteur, ce second signe 
5 creant un effet visuel coherent avec la voie entendue par le 
telespectateur. 



Selon un mode de realisation, pour former le voile en 
to question, on prend la valeur moyenne de la luminance de 
I'image a I'interieur d'un domaine phonateur, on memorise 
cette valeur moyenne, et, sur une image ulterieure, on 
effectue un fondu entre la valeur moyenne memorisee et 
I'image ulterieure en question, le fondu allant croissant de la 
75 peripheric au centre du domaine. 

Selon un autre mode de realisation, avantageusement 
combine au precedent pour former le second signe phono- 
visuel, on agit sur les signaux de chrominance de I'image. 
Selon une autre caracteristique de ('invention, le 
20 telespectateur peut regler a sa guise i'ampleur des signes 
phonovisuels apparaissant sur son re cepteur. 

Selon une autre variante, plus elaboree, on peut 
memoriser periodiquement I'image du domaine phonateur 
d'origine et par un trartement d'image approprie, modifier 
25 cette image en liaison avec le signal sonore de traduction 
associe. 

De toute facon, les caracteristiques de rinvention ap- 
parattront mieux apres ta description qui suit, d'exemples de 
realisation donnes a titre explicatif et nullement limitatif. 
30 Cette description se refere a des dessins annexes, sur 
lesquels : 

• la figure 1 , deja decrite, illustre le precede de sous-titrage 
selon I'art anterieur, 

35 

- la figure 2, egaJement decrite, illustre le precede de 
douWage selon I'art anterieur, 

- la figure 3, deja decrite, represente symboliquement le 
40 precede de rinvention, 

- la figure 4 est un schema illustrant la caracterisation des 
domaines phonateurs d'une image, 

45 - la figure 5 est un schema synoptique d'un recepteur pour 
la mise en oeuvre du precede de rinvention, 

- la figure 6 montre un detail de ce recepteur avec ses 
deux processeurs, 

50 

• la figure 7 montre un autre detail de ce recepteur avec un 
selecteur de voie sonore, 

- la figure 8 illustre un mode particulier de realisation d'un 
55 processeur. 



La commando des signes phonovisuels mis en oeuvre 
dans rinvention pour creer I'image transcrite depend du 
60 type de recepteur utilise. On peut distinguer, a ce sujet, 
deux categories de recepteurs : 

- ceux qui sent depourvus de memoire et d'intelligence et 
qui recoivent a chaque image, toutes les donnees qui sont 

55 necessaires pour guider leur comportement ; 

- ceux qui sont dotes de memoire et d'intelligence ; et qui 
disposent d'un logiciel approprie et sont capables, pour 
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chaque plan, de faire un apprentlssage des relations phono- 
visuelles particuli&res etablies entre les locuteurs et la 
camera pour ce plan* lis en connaissent done l'6tat et sont 
capables d'en suivre continument revolution, sort a partir 
des donnees exogenes qu'ils recoivent, sort a partir des 
donnees endog6nes provenant par exemple du traitement 
de I'image recue. 



Dans la description qui suit on s'attachera surtout au 
premier cas, le second s'en deduisant hnmediatement 

La premiere phase du precede de r invention consists 
a former les donnees aptes a guider le recepteur dans la 
formation des signes phonovisuels. On distignuera trois 
categories de donnees, respectivement notees Dio, DSo et 
DSj, ou Dio sont les donnees associees a rimage d'origine 
(io), DSo ies donnees asscciees a la voie sonore d'origine 
(So) et DSj les donnees associees a une voie sonore de 
traduction de rang j (S|). On suppose qu'il y a n traductions 
disponibte8 et que I'on choisit la ji6me. avec j compris entre 
1 etn. 

a • \m tfopnws wraiteg a I'irnggg dadoing PIq 

Ces donnees sont etaJborees de preference a partir de 
rimage d'origine, telle que vue sur un ecran, et du signal 
vid6o qui lui correspond. Elles orrt pour but : 

- la classification des plans en plans a traiter et en plans a 
ne pas traiter ; ii se peut en effet qu'il sort pr6f6rable de ne 
pas traiter visueitement certaines images ; cette donnee de 
traitement est notde Tt ; 

- ridentification des plans a traiter : cette donnee est not6e 
Pi, i etant le rang d'un plan ; dans I'invemion, un plan est 
constitue d'une certaine configuration de locuteurs dans le 
champ de la camera ; 

- ridentification d'une sequence de plans Pi, P» + 1... pour 
que le processeur video, a la reception, tienne compte des 
transitions de plan a plan ; cette donnee est notee Seq ; 

~ ('identification des locuteurs (actifs ou potentials) d'un plan 
; cette identification se tradurt par des donnees 11, 12, 13... 
dassees, le cas echeant, par ordre d'importance ; 

• la localisation, par rapport a r ecran, du centre du domaine 
phonateur ; ces donnees sont not6es XiYi, pour le i m * 
locuteur ; 

• (a determination de la taille relative du domaine phonateur, 
sort Qi ; ces donnees peuvent etre elabo rees par des 
moyens faisarrt appel a la technique de la reconnaissance 
de forme et/ou par r assistance d'un operateur ; 

- la determination de 1'attitude du locuteur ; la donnee 
correspondarrte est notee A. 



La figure 4 illustre un exemple de parametres utilises 
pour la localisation de deux domaines phonateurs dans une 
image qui comprend deux locuteurs. Ces domaines ont pour 
centres les points de coordonnees X1Y1 et X2Y2 et des 
dimensions Q1 et 02. Par " dimensions" , il faut entendre 
sort un diametre, sort le cote d'un carre, sort tout autre 
grandeur liee a retendue du domaine qui est a I'origine du 
son. 



La donnee A penmet de classer chaque locuteur dans 
I'une des classes suivantes : 

• celle des locuteurs que I'on peut voir et entendre parler, 
5 s'ils partem ; 

• celle des locuteurs que i'on peut voir parler mais que i'on 
n'entend pas , s'ils partem ; 

to - celle des locuteurs que I'on ne peut voir parler, mais que 
I'on entend, s'ils partem, sort que le centre de locution n'est 
pas dans le champ de la camera, sort qu'il est dans le 
champ, mais cache. 

75 

Le cas du locuteur que I'on entend parler mais que 
I'on ne voit pas est typiquement celui du locuteur qui est 
temporairement hors du champ visual, tout en restant 
present dans Paction. La voix dite "ofT, typique du do- 

20 cumentaire, qui correspond a un locuteur etranger a Pac- 
tion, donne evidemment lieu a traduction ; elie peut etre 
reporee par un signe visuel specifique, par exemple un 
carre en bas de I'ecran. 

Le cas du locuteur que I'on entend parler, que I'on 

25 vort, mais dont on ne voit pas I'organe phonateur est 
typiquement celui dont fattitude corporelle eat telle que le 
locuteur se trouve masque par luimeme ou par un objet 

B - Les donnees associees a la voie sonore d'origine DSo 

30 

Elles contiennent des informations relatives a ridenti- 
fication de chaque locuteur potentiel de la scene. Pour 
chacun d'eux une variable d'etat Pol, Po2, ... indique, 
seton sa valeur binaire, si le locuteur d'origine considere 
35 parte ou se tart. Cette variable Po peut etre obtenue sort 
par detection automatique sur la voie audio correspondents, 
sort par un operateur a I'ecoute. 

C ■ Les donnees associees aux votes sonores de traduction 
40 egj 

Ces donnees comprennent : 

- des donn6es d'identrfication du locuteur-traducteur pour la 
45 languej;sortljl, lj2, IJ3 ... ; 

- des variables d'etat Pt1, Pt2 indiquant si le locuteur- 
traducteur parte ou se tait ; 

50 - des variables Bhl, Bh2, etc... qui decrivent ractivite 
phonique de chaque locuteur-traducteur telles que : 



- le traducteur a la bouche fermee, 

55 

- le traducteur a la bouche ouverte, 

- te traducteur est en train d'ouvrir la bouche, 
60 - le traducteur est en train de former la bouche. 



Cette variable Bh peut etre aisement obtenue par un 
65 dispositrf de detection tie physiquemem au locuteur- 
traducteur. 
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Ces trois categories de donnees sont rassemblees 
dans le tableau survant L'ensemble de ces donnees cons- 
titue un code phonovisuel, qui est associe aux signaux 
victeo et audio habituels. 

5 

Tableau des diverses donnees d'imaoe et de son 

10 
15 

20 

25 . 

00 

35 

40 

46 

50 

55 

60 

65 
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IMAGE 



SON 



V01X 

rforigine 
(DSo) 



voix de 
traduction 
(OSj) 



10 



DonnSes g£n6rales : 

Tt : traite m ent 

Pi : identification 
xles plans 

Seq : sequences des 
plans h traiter 



15 



20 



Donn^es ttees aux locuteurs 

1 er locuteur (forigine : 

/^(1,Y1 : coordonn4es du 

centre du do maine 
phonateur 



61 



A1 



Io1 : identification 

Po1 : intervalies 
phonateurs 



: grandeur du 
do maine 
phonateur 

: attitude du 
1er locuteur 



Ij1 : identification 

Pt1 : intervalies 
phonateurs 

Bh1 : activity 
phonique 
du locuteur 
traducteur 



25 



30 



2^ m e locuteur cPorigine ; 
/^X2,Y2 : 
G2 : idem 



A2 



3* m e locuteur 
etc^. 



Io2 : identification Ij2 : identification 



Po2 : intervalies 
phonateurs 



Pt2 : intervalies 
phonateurs 

8h2 : activity 
phonique 
du locuteur 
traducteur 



35 



On va decrire maintenant !es moyens a mettre en 
oeuvre pour traiter toutes ces donnees. 



65 
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La figure 5, tout d'abord, montre symboliquement las 
dlverses entrees-sorties d'un recepteur apte a mettre en 
oeuvre Tinvention. On y trouve : 



une entree de signal video relatif a I'image d'origine. soit 



6 
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lo, 

• une entree de donnees d'image d'origine, soit Dlo, 

• une entree de signal audio relatif au son d'origine, sort So, 

- une entree de donnees de son d'origine, soit DSo, 

• des entrees de signaux audio relatifs a differentes langues 
S1 a Sn. 

- des entries de donnees correspondantes DS1, ... DSn. 



Le telespectateur dispose d'un dottier de commands 
54 permettant de selectionner une iangue (soit la langue 
d'otigine Lo, soit une langue j prise parmi n langues 
Strangles Li, L2,...). Un signal de selection de langue SL 
est amis par ce boltier. 

Le telespectateur dispose encore d'un second moyen 
de commande 55, qui tui permet de regler I'ampleur des 
signes phonovisuels apparaissant sur rimage transcrite qu'il 
observe. Le signal de commande correspondent est note 
Dp. 

Tous ces signaux ou donnees sont appliques a un 
circuit 50 qui est forme, comma on le verra mieux sur les 
figures suivantes, d'un processeur video 60, d'un proces- 
seur audio 70 et d'un selecteur 80. Ce circuit 50 delrvre un 
signal video lp et un signal audio Sp, qui sont appliques sur 
un tube a rayons cathodiques et un haut-parieur 56 et 
defmissent respectivement I'image et le son presentes au 
telespectateur. 

La figure 6 montre, plus en detail, les entrees-sorties 
des processeurs 60 et 70. 

Le processeur video 60 possede cinq entrees 61, 62, 
63, 64, 65 qui recoivent respectivement les signaux lo, Dlo, 
DSo, DSj et Dp, et une sortie 66 qui delrvre le signal 
d'image presentee lp. 

Le processeur audio 70 possede trots entries 71 , 72, 
73 qui recoivent les signaux So, Sj et Dp et une sortie 74 
qui delrvre le signal de son presente Sp. 

La figure 7 montre le selecteur 80 qui possede six 
entrees 81, 82, 83, 84, 85 et 86 qui recoivent respective- 
ment les signaux S1, DS1, DS2, S2, et SL et deux sorties 
87 et 68 qui delivrent respectivement le signal sonore Sj 
reiatrf a la langue j selection nee et les donnees associees 
DSj. 

Ce selecteur comprend un premier muftiplexeur 90 a 
autant d'entrees de signal 92-93 que de langues disponi- 
bles (2 dans le cas illustre). ces entrees etant reliees aux 
entries 82 et 83 recevant les donnees des drverses Ian- 
gues ; ce muftiplexeur possede aussi une entree de com- 
mande 95 reliee a I'entree 85 d'ou eile recoit le signal de 
selection SL ; il possede errfin une sortie 98 reliee a la 
sortie 88, ou apparaissent les donnees setectionnees DSj. 

Le selecteur comprend encore, de la meme maniere, 
un multiplexeur 100 a deux entrees 101 et 104 reliees aux 
entrees 81 et 84 et recevant d'elles les signaux de son des 
drverses langues Si, S2 (2 en roccurrence) ; le multiple- 
xeur comprend encore une entree de commande 106 reliee 
a I'entree 86, d'ou eile recoit le signal de selection de 
langue ; il possede enfin une sortie 107 reliee a la sortie 
87, ou apparart le signal sonore selectionne Sj. 

On va decrire maintenant un exempie de processeur 
video dans le cas particulier ou le signe phoncvisuel intro- 
duit est une sorts de voile qui semWe interpose entre 
I'organe phonateur des locuteurs et I'ecran. Le demandeur 
designe cet artifice phoncvisuel par "voile de Babel". 



L'usager qui suit un programme de television, dans 
une langue qui n'est pas la langue d'origine selectionne 
cette langue d'ecoute, ce qui a pour effet de faire appa- 
rattre ce voile. L'usager peut en ajuster certaines ca- 

5 racteristiques. 

L'effet de ce voile est le suivant Lorsqu'un locuteur 
d'origine parte, par exempie le locuteur identifie par la 
donnee 11, un halo se forme autour du centre de locution 
correspondant, dont les coordonnees sont X1Y1, avec une 

JO dimension fixee par Q1. L'effet visuel est analogue a celui 
que Con observe lorsque quelqu'un parte trop pres d'une 
vitre et que de la buee apparaTt Le role de ce halo est 
d'tdentifier le locuteur qui parte, mats egaiement de masquer 
I'essentiel des mouvements de sa bouche. Ce halo est 

75 forme principalement par traitement du signal de luminance 
au voisinage du point de coordonnees X1Y1. A I'interieur 
d'un domaine defini par un generateur de forme, qui pout 
dependre de la variable G fixant la grandeur du domaine 
phonateur et de la variable A refletant I'attitude du locuteur, 

20 on catcule la valeur spatiale moyenne de I'image, on integre 
cette valeur dans le temps, d'image a image, avec une 
constants de temps suffisante pour masquer le mouvement 
des levres, puis on effectue un "fondu enchame" entre ce 
signe et rimage d'origine, le fondu etant commande : 

25 

• temporellement par la variable P01 au debut d'un inter- 
vals de locution (passage de POl de 0 a 1), le halo 
apparaissant rapidement, tandis qu'a la fin (passage P01 
de 1 a 0), le halo ne s'evanouit que lentement, 

30 

- en amplitude, seton la variable Dp, pour masquer tota- 
lement le domaine de locution ou le laisser transparaitre. 



35 Lorsque le iocuteur-traducteur associe, identifie par la 

donnee Ijl, commence a prononcer la traduction (passage 
de 0 a 1 pour Ptl) et si Ton voit parler le locuteur d'origine, 
un deuxieme signe visuel vient se superposer au halo. Des 
moyens de synchronisation permettent, remission, de 

40 contrdler la valeur de I'intervalle de temps qui separe le 
passage a i des variables P01 et Ptl, et cela par intro- 
duction d'un retard fixe sur I'image et la voie sonore d'origi- 
ne et de retards variables sur les voies de traduction. Le 
deuxieme signe visuel est place autour du meme point de 

45 coordonnees X1Y1, et depend egaiement de G1 et de A1. 
Dans la description qui suit, on suppose que ce second 
signe est engendre dans un plan de chrominance. 

Disposant de la donnee Bhl qui definit le mouvement 
des levres du Iocuteur-traducteur, ce second signe peut 

so evoluer, temporellement et spatialement, au rythme de Bhl, 
recreant de ce fait un effet psychovtsuel coherent avec la 
voix entendue. 

Comme deja dit, l'usager, par la variable Dp, dispose 
d'un moyen pour ajuster, selon son gout et les circon- 

55 stances, t'ampleur des signes visuels presentes, telle que 
leur taille, leur luminance ou leur chrominance, etc... 

Dans cet exempie de realisation, qui utilise les signaux 
de luminance et ceux de chrominance, le processeur video 
se presente comme illustre sur la figure 8. II comprend tout 

60 d'abord un separateur video 100, qui recoit le signal video 
• d'origine lo et qui delivre, sur trois sorties, le signal de 
luminance Y, le signal de chrominance Ch (forme en fait de 
deux composantes) et les signaux de synchronisation de 
ligne et de trame L et T. 
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Le processeur comprend ensurte une pluralite de votes 
de traitement, chacune affectee a un locuteur. Le cas 
illustre comporte deux tefles votes 110 et 120, mais ceci 
n'est evidemment qu'un exemple. Comme ces deux votes 
sont identiques, on ne decrira que la premiere, dont les 
references sont affectees d'un indice 1, les memes com- 
posants sont utilises pour la seconde, mais avec I'indice 2. 

Cette premiere vote comprend : 

• un generateur de halo QH1, qui recoil le signal de 
luminance Y, les signaux de synchronisation de Itgne et de 
trame L t T, les donnees d'image Din relatives au premier 
locuteur, (qui comprennent les donnees X1Y1, G1, A1 deja 
definies), une donnee de son d'origine, a savoir P01, la 
donnee de sequencement Seq et enfin la donnee de 
reglage Dp ; ce generateur de halo delivre un signal de 
luminance modifie Ypl ; 

• un generateur de eigne GDI, qui recoit le signal de 
chrominance Ch, les signaux de synchronisation de ligne et 
de trame L, T, la variable de sequencement Seq, les 
donnees DH (X1, Y1, G1, A1), des donnees de son 
comme Ptl et Bhi et la donnee de reglage Dp ; ce second 
generateur delivre un signal de chrominance modifie Chpi. 



Le processeur comprend encore un premier aigutllage 
130Y, qui recoit le signal de luminance d'origine Y, et les 
signaux de luminance modifies Ypl , Yp2 et qui delivre Tun 
ou I' autre de ces signaux, salon la valeur de la donnee Tt 
qui determine si le traitement doit avoir lieu ou non. 

Le processeur comprend un second aigutllage l30Ch, 
identique au precedent, mais affects aux signaux de chromi- 
nance (d'origine ou modifies). 

Enfin, le processeur comprend un melangeur 140 a 
deux entrees recevant Yp et Chp et une sortie deiivrant le 
signal video Ip a presenter au tube cathodique. 

Revendfcations 



1. Procede de television pour programmes muftilingues, 
dans lequef : on forme un signal video correspondent a une 
scene comprenant au moins un locuteur, on forme un signal 
audio correspondent aux paroles prononcees par les lo- 
cuteurs de la scene, on forme egalement des signaux audio 
de doublage en diverses langues provenant de locuteurs- 
traducteurs, on emet transmet ou enregistre et relit un 
signal de television composite rassemblant ce signal video 
et ces signaux audio, on recoit ce signal composite sur un 
recepteur de television apte a reconstrtuer une image de ta 
scene a partir du signal video et a restrtuer les paroles 
prononcees sort par les locuteurs d'origine, sort par les 
locuteurs-traducteurs, a partir des signaux audio, ce 
procede etant caracteriae par le fait que : 



a) a la production : 

- on effectue une analyse spatiale de I'image pour detecter 
la presence et deftnir {'emplacement de domaines phona- 
teurs et Ton traduit cette analyse en un premier type de 
donnees, 

• on effectue une analyse temporalis des intervaJIes phona- 
teurs des locuteurs d'origine pour determiner notamment le 
debut et la fin de ces intervaJIes et Pon traduit cette analyse 
en un deuxieme type de donnees, 



• on effectue une analyse temporelle des intervaJIes phona- 
teurs des locuteurs-traducteurs pour determiner notamment 
ie debut et la fin de ces intervaJIes ainsi que revolution de 
5 leur ectrvite de phonation et Ton traduit cette analyse en un 
troisieme type de donnees, 

- on rassemble ces trois types de donnees phonovisuelles 
pour constituer un code phonovisuel, 

10 

b) a remission, a la transmission ou a renregistrement : 

- on associe par multiplexage ce code phonovisuel au 
75 signal de television composite precite, en vue de le trans- 

mettre ou I'emettre ou I'enregistrer, 

c) a la reception : 

20 

- on separe le code phonovisuel ainsi multiplexe du signal 
composite, 

- on en extrait les donnees d'image tradutsant I'empla- 
26 cement des domaines phonateurs, les donnees de son 

relatives a la voie sonore d'origine et les donnees de son 
relatives aux votes sonores de traduction, 

- on selecttonne Tune des votes sonores d'origine ou de 
30 traduction, 

- en cas de selection d'une des votes sonores de tra- 
duction, on forme a partir des donnees d'image et des 
donnees de son correspondent tant a (a voie sonore d'origi- 

35 ne qu'a la voie sonore solutionnee, au moins un signe 
phonovisuel prenant place dans i'image aux emplacements 
des domaines phonateurs, ce signe etant genera au moyen 
notamment de donnees recues, 

40 - on affiche sur I'ecran du recepteur non pas I'image 
d'origine mais une image modifiee par ce signe phonovisuel 
aux fins, sort de diminuer le hiatus phonovisuel entre I'image 
et le son percus par le telespectateur, soit de permettre 
I'affectatton non ambigue d'une voie entendue, a un lo- 

45 cuteur vu. 



2. Procede selon la revendication 1, caracterise par le fait 
que les donnees du premier type relatives a Pimage com- 
50 prennent, en tout ou partie : 



- des donnees determinant si un plan image est ou n'est 
pas a traiter seion la revendication 1, 

55 

- des donnees tdentifiant des sequences de plans a traiter, 

- des donnees identifiant cheque locuteur d'un plan- image, 

60 - une donnee btnaire d'etat pour chaque locuteur indiquant 
si ce locuteur parte ou se tait, 

- une donnee binaire d'etat, pour chaque locuteur qui parte, 
liee a son activite phonique vue, 
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- des donnees definissant les coordonnees des centres des 
dometnes phonateurs, ou penTtettant d'en sutvre revolution, 
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* des donnees relatives a la taille des domaines phonateurs, 
ou permettant d'en survre ('evolution. 



3. Precede seion ia revendication i , caracterise par te fait 5 
que ies donnees du troisieme type relatives a la vote sonore 
de traduction comprennent. en tout ou parte : 



- des donnees ^identification des locuteurs-traducteurs, ro 

• urte donnee d'etat binaire pour chaque locuteur-traducteur 
indiquant si ce locuteur-traducteur parte ou se tart, 

- une donnee liee a I'activite phonique de chaque locuteur- 75 
traducteur. 



4. Precede selon la revendication 1 , caracterise par le fait 

que I'on utilise deux signes phonovisuete : 20 



- un premier signe phonovisuel en forme de voile defini 
dans sa position et sa grandeur par Ies donnees du premier 
type, et du second type, ce premier signe masquant le 25 
hiatus, 

- un second signe phonovisuel combine audit voile et defini 
par Ies donnees du troisieme type liees aux locuteurs- 
traducteurs et notamment a la donnee liee a I'activrte phoni- 30 
que du locuteur-traducteur, ce second signe cream un effet 
visual coherent avec la voix entendue par le telespectateur. 



5. Precede selon la revendication 4, caracterise par le fait 35 
que pour former le voile en question, on prend ta valeur 
moyenne de la luminance de I" image a I'interieur d'un 
domaine phonateur, on memorise cette valeur moyenne, et 

sur une image ulterieure, on effectue un fondu entre la 
valeur moyenne memorisee et I'image ulterieure en ques- 40 
ton, le fondu aiiant croissant de la peripheric au centre du 
domaine. 

6. Precede selon la revendication 4, caracterise par le fait 

que, pour former le second signe phonovisuel. on agit sur le 45 
signal de chrominance de I'image.. 

7. Precede selon la revendication 1 , caracterise par le fait 
qu'on imroduit un retard fixe sur I'image et la voie sonore 
d'origine et un retard regiabie sur les signaux de son des SO 
votes de traduction. 

8. Precede selon la revendication 1, caracterise par le fait 
que, dans le recepteur de television, on regie manueltement 
I'ampteur des signes phonovisuels apparaissant sur le 55 
recepteur. 
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